染色体还可以这样用?看天大团队用DNA存储数据!
天津大学元英进教授团队从头编码设计合成了一条长度为254,886 bp、专用于数据存储的酵母人工染色体,借助人工染色体合成技术和叠加水印的LDPC编码策略将两张经典图片和一段视频存储于高效组装的人造染色体,利用酵母繁殖实现了数据稳定复制,并用便携式的三代纳米孔测序器件实现了数据快速读出与无错恢复。
人工染色体示意图
从医学图像到天文观测,从视频监控到社交网络,全球数字化趋势使得数据量快速增长。据国际数据公司估计,到2025年全球数据总量将达到惊人的175 ZB(1 ZB ≈ 10^9 TB)。面对快速增长的存储需求,科学家们开始寻找和尝试更多全新的存储技术。随着合成生物学的快速发展,DNA信息存储由于其高信息密度与低能耗处理等特点,被视为一种具有潜力的存储技术,成为应对数据存储增长挑战的新机遇。2021年1月,美国半导体产业协会(SIA)发布的《半导体10年计划》,已将DNA信息存储列为未来海量数据存储的重要选项。
元英进教授带领珠峰计划合成生物学前沿科学中心的研究团队,借助其在酵母人工基因组化学合成领域的积累,设计合成了一条自然界不存在的人工染色体,其中存储了两张图片及一段视频,并实现了数据的稳定复制与快速可靠读出。该工作首次将单个菌株内用于数据存储的DNA碱基数量提升到了百kbp级,容纳数据量为37.8 KB。日前,该研究以“An artificial chromosome for data storage”为题在线发表于《国家科学评论》(National Science Review, NSR, IF=16.693)。天津大学微电子学院青年教师陈为刚副教授、化工学院博士研究生韩明哲以及助理研究员周见庭为论文共同第一作者,元英进教授为论文通讯作者。
人工染色体中存储的两张经典照片:1968年12月24日阿波罗8号机务人员威廉·安德斯拍下的“地球升起”(jpg;4029 Byte)和1957年Harold Edgerton首次结合高科技频闪灯与相机快门拍摄的“牛奶皇冠”(jpg;6624 Byte)。
人工染色体中存储的视频“母女”(一个通信领域常用的测试视频;mp4; 26,092 Byte)
研究者从染色体的编码设计、组装与稳定复制、数据可靠恢复等方面展示了这种数据存储模式的潜力。
染色体的编码设计中,通过叠加伪随机序列作为水印应对三代测序带来的插入/删除(insertion/deletion)错误,采用现代通信中已广泛验证的低密度奇偶校验(Low-Density Parity-Check,LDPC)码纠正替代错误,实现了高达10%错误率纳米孔测序数据的可靠恢复。
染色体组装与稳定复制方面,在该人工染色体中设计插入了酵母自主复制序列(autonomously replicating sequence,ARS),提升的染色体稳定性,支撑高效组装和稳定复制。实验表明,染色体稳定复制100代后,依然能可靠读出数据。
数据读出过程中,利用三代纳米孔测序大约10分钟,获得足够的原始读段后,结合研究者设计的生物信息学与纠错译码混合流程,可以从高错误率约为10.79%的原始读段中可靠恢复原始图片及视频,所需测序覆盖度仅为16.8x。
数据存储工作流程
该存储模式中,数据逻辑密度(包含载体)为1.19 bit/bp,与目前文献中指标最高的四进制编码DNA喷泉方案相当(Erlich and Zielinski, 2017)。文章进一步指出了该存储模式与传统光盘存储的相似性,即:一次写入,多次读出,低成本可靠复制和便携式读取。作者还讨论了DNA低成本合成、构建多条人工染色体存储更多数据的可行性。
作者团队还围绕DNA信息存储撰写了综述,归纳了其主要模式、发展现状及技术路线,探讨了实用化应用面临的主要挑战,展望了DNA作为信息存储介质在现代存储系统中的发展演化趋势。相关论文发表在《合成生物学》(Synthetic Biology Journal, SynbioJ)。
《国家科学评论》(National Science Review, NSR)论文链接:https://doi.org/10.1093/nsr/nwab028
《合成生物学》(Synthetic Biology Journal, SynbioJ)论文链接:http://www.synbioj.com/CN/10.12211/2096-8280.2021-001
2021的第一朵海棠开了!如果把天大的春天穿在身上
@天大人,新冠疫苗接种前后需要知道啥?一图了解→
天大新冠疫苗接种现场,你接种了吗?
天大新冠疫苗接种工作就要开始啦!这些知识你需要知道
连续三年国家奖学金,4.0 满绩......天大学霸演绎大学生活的多种可能!
「 天 津 大 学 新 媒 体 中 心 」投稿 & 加入我们 tjunmc2019@163.com